Samvariasjon: Quiz
En regresjonsmodell gir deg følgende ligning: \(y=23.41 + 1.12 \times x\). Hva er gjennomsnitt i y når x er 10?
En regresjonsmodell gir oss ligningen \(y = \beta_0 + \beta_1 \times x\) hvor skjæringspunktet er 5145 og stigningstallet er 2781. Hva er forskjellen mellom \(x_a = 14\) og \(x_b = 28\)
\(x_a: 5145 + 2781 \times 14 = 44079\)
\(x_b: 5145 + 2781 \times 28 = 83013\)
\(2781 \times (28-14) = 38934\)
\(\Delta y = \beta_1 \times \Delta x\)
Hva er forskjell i log(årsinntekt) for hvert antall mål (ant_mål) når vi kontrollerer for posisjon og kamper_tot i datasettet fotball_1_2_3.csv. Bruk et filter som tar vekk keeperer.
| Uavhengig variabel | Estimat | Standardfeil |
|---|---|---|
Intercept (Skjæringspunkt) |
12.94 | 0.12 |
Antall mål |
0.06 | 0.02 |
Posisjon: forsvar - angrep |
0.22 | 0.13 |
Posisjon: midtbane - angrep |
−0.03 | 0.12 |
Kamper totalt |
0.00 | 0.00 |
posisjon != "keeper")Hva er økningen i årsinntekt for hvert antall mål i prosentdeler fra modellen: log(årsinntekt) ~ ant_mål + posisjon + kamper_tot
\[\operatorname{log}(a) - \operatorname{log}(b) = \operatorname{log}\left(\frac{a}{b}\right)\]
\[\operatorname{exp}(\operatorname{log}(a) - \operatorname{log}(b)) = \frac{a}{b}\]
\[\%\text{økning} = 100 \times \left(\frac{a}{b}-1\right)\]
\[\%\text{økning} = 100 \times (\operatorname{exp}(0.06)-1) = 6.2\%\]
I en regresjonsmodell med timer_tren som avhengig variabel og idrettslag og kjønn som uavhengige variabler fra datasettet student_trening_1_2_3.csv, hva er differensen mellom de som oppgir ja sammenlignet på nei i variabelen idrettslag? Oppgi svaret med to desimaler.
timer_tren idrettslag kjonn dummy_idrettslag dummy_kjonn
1 1 nei kvinne 1 0
2 6 nei kvinne 1 0
3 2 nei mann 1 1
4 4 nei mann 1 1
5 5 ja kvinne 0 0
6 10 ja mann 0 1
\[y=\beta_0 + \beta_1x_{\text{dummy_idrettslag}} + \beta_2x_{\text{dummy_kjønn}}\]
\[\text{idrettslag}=\text{"nei"}, x_{\text{dummy_idrettslag}} = 1:\\ y=\beta_0 + \beta_1 \times 1\]
\[\Delta y = \beta_1 \times \Delta x\]
\(\beta_1=\) -1.47
I en regresjonsmodell med timer_tren som avhengig variabel og idrettslag og kjønn som uavhengige variabler fra datasettet student_trening_1_2_3.csv, hva er gjennomsnittet i treningstid for kvinner som oppgir nei i variabelen idrettslag? Oppgi med to desimaler.
\[y=\beta_0 + \beta_1x_{\text{dummy_idrettslag}} + \beta_2x_{\text{dummy_kjønn}}\]
\(\beta_0 + \beta_1 =\) 4.14
Angi odds-ratio for medlemskap i et idrettslag når menn sammenlignes med kvinner.
| Idrettslag | Kjønn | Antall |
|---|---|---|
| ja | kvinne | 60 |
| nei | kvinne | 356 |
| ja | mann | 80 |
| nei | mann | 148 |
\(\operatorname{OR} = \frac{80}{148} / \frac{60}{365} = 3.21\)
Hvilken korrelasjonskoeffisient beskriver best lineær samvariasjon mellom variablene A og B?
Pearsons r = -0.075
Spearmans rs = 0.596
Lag en ny variabel basert på variabelen helse hvor “mindre bra” helse gis tallet 0 og “bra” og “svært bra” begge gis tallet 1. Hva er betinget samvariasjon mellom den nye helsevariabelen (avhengig variabel) og timer_tren når vi samtidig bruker sivil_stat, kjønn, økonomi, idrettslag og tren_senter som “kontrollvariabler”. Angi svaret som et odds-ratio (to desimaler).
\(OR = 1.25\)
For hvert times økning i timer_tren stiger odds for god helse (helse2 = 1) 1.25 ganger.
Du sammenligner grupper, hvilken regresjonsmodell tilsvarer en uavhengig t-test som sammenligner log(årsinntekt) mellom landslagsspiller og ikke-landslagsspiller?
\(y_1 - y_2 = \beta_0\)
\(y = \beta_0 + \beta_1 \times x_{\text{landslag}} + \beta_2 \times x_{\text{posisjon}}\)
\(y = \beta_0 + \beta_1 \times x_{\text{landslag}}\)
\(y_{\text{landslag}} = \beta_0 + \beta_1 \times x_{\text{årsinntekt}}\)